本文档介绍 A1 平台与 Jina AI 集成的相关接口函数及参数定义。Jina AI 提供网页内容提取、搜索和文本分割等功能,适用于构建智能数据处理和检索系统。
一、jina_ai_read
功能说明
通过 Jina AI Reader API 从指定 URL 提取结构化的网页内容。适用于需要将网页转换为 LLM 友好格式的场景,如内容采集、知识库构建等。
输入参数
| 参数名 | 类型 | 必填 | 说明 |
|---|
api_key | String | * | Jina AI API 的认证密钥 |
url | String | * | 需要解析的目标网页地址 |
输出参数
| 参数名 | 类型 | 说明 |
|---|
title | String | 网页标题 |
description | String | 页面描述信息 |
url | String | 解析的原始 URL |
content | String | 提取后的网页内容(Markdown 格式) |
metadata | Object | 包含页面元信息的对象 |
result | Object | 包含外部资源或扩展信息的对象 |
二、jina_ai_search
功能说明
通过 Jina AI Search API 执行智能搜索并返回结构化结果。适用于需要获取高质量搜索结果的场景,如问答系统、信息检索等。
输入参数
| 参数名 | 类型 | 必填 | 说明 |
|---|
api_key | String | * | Jina AI API 的认证密钥 |
question | String | * | 需要搜索的问题或关键词 |
country | String | - | 搜索的目标国家/地区(如 US、CN) |
language | String | - | 搜索的语言(如 en 表示英语、zh 表示中文) |
输出参数
| 参数名 | 类型 | 说明 |
|---|
title | String[] | 搜索结果中每个条目的标题数组 |
url | String[] | 搜索结果中每个条目的链接数组 |
description | String[] | 搜索结果中每个条目的描述数组 |
三、jina_ai_split
功能说明
通过 Jina AI Split API 将大段文本内容(如 Markdown、HTML 或纯文本)拆分成更小的块(chunks)。适用于需要将长文本分块进行进一步处理或分析的场景,如 RAG 系统、文档索引等。
输入参数
| 参数名 | 类型 | 必填 | 说明 |
|---|
api_key | String | * | Jina AI API 的认证密钥 |
content | String | * | 需要被分割的原始文本内容 |
return_tokens | Boolean | - | 是否在响应中包含 tokens 信息 |
return_chunks | Boolean | - | 是否在响应中包含 chunks 内容 |
max_chunk_length | Integer | - | 每个 chunk 的最大长度,默认为系统设定值 |
输出参数
| 参数名 | 类型 | 说明 |
|---|
chunk_positions | Number[] | 每个 chunk 在原始内容中的起始位置数组 |
tokens | Array | 如果启用 return_tokens,则包含 token 数组 |
chunks | String[] | 如果启用 return_chunks,则包含 chunk 字符串数组 |
四、使用示例
4.1 网页内容提取流程
4.2 智能搜索流程
4.3 文本分割流程
4.4 完整业务场景
五、注意事项
| 项目 | 说明 |
|---|
| API 密钥 | api_key 需在 Jina AI 官网 申请 |
| 请求限制 | 免费版有请求次数限制,建议合理控制请求频率 |
| URL 格式 | 输入的 URL 需要包含协议(如 https://) |
| 文本长度 | jina_ai_split 对超长文本可能有处理限制,建议分段处理 |
| 错误处理 | 建议对接口返回结果进行异常捕获和处理 |
如需更多帮助,请参考 Jina AI 官方文档 或联系技术支持。